Kurs 2 — Dateien verarbeiten
In vielen Unternehmen beginnen Geschäftsprozesse mit einem Dokument: eine Bestellung geht als PDF ein, ein Lieferschein wird eingescannt, eine Rechnung muss geprüft werden. Bevor ein Workflow solche Dokumente verarbeiten kann, müssen mehrere Fragen beantwortet werden:
- Wie kommt das Dokument in den Workflow? — Dokumente müssen dem System zugeführt werden.
- Was für ein Dokument ist das? — Kategorisierung: Ist es eine Rechnung, ein Lieferschein oder etwas ganz anderes?
- Was steht drin? — Extraktion: Welche Daten sind relevant und wie werden sie strukturiert herausgelesen?
- Wohin mit den Daten? — Persistenz: Wie werden extrahierte Daten strukturiert in einer Datenbank gesichert?
- Was wenn mehrere Dokumente auf einmal ankommen? — Vereinzelung: Wie wird eine Nachricht mit mehreren Dokumenten so aufgeteilt, dass jedes einzeln verarbeitet wird?
Dieser Kurs führt dich Schritt für Schritt durch alle fünf Themen. Du lernst zuerst anhand eines einzelnen Dokuments die Grundlagen — und am Ende, wie du das Gelernte auf mehrere Dokumente gleichzeitig anwendest.
In der Praxis kommen Dokumente aus verschiedenen Quellen in einen Workflow — per E-Mail, aus Netzlaufwerken oder über Schnittstellen zu anderen Systemen. In diesem Kurs arbeitest du ausschließlich mit dem Web Form Agent: Du lädst Dokumente manuell über ein Formular im Browser hoch. So kannst du dich voll auf die Verarbeitung konzentrieren, ohne vorher externe Systeme einrichten zu müssen.
Wie 42°flow mit Dateien umgeht
Wenn ein Dokument einem Workflow zugeführt wird — egal ob per Web-Formular, E-Mail oder aus einem anderen System — speichert 42°flow die Datei in einer integrierten Dateiablage. Ab diesem Zeitpunkt ist die Datei über einen Dateipfad erreichbar. Dieser Pfad wird in der Nachricht mitgegeben und ist der Schlüssel, über den alle nachfolgenden Agents auf die Datei zugreifen. Wenn also ein Read File Agent eine Datei lesen soll, braucht er in seiner Konfiguration oder der eingehenden Nachricht genau diesen Pfad.
Was dich erwartet
Theorie — vier Einheiten. Du lernst wie 42°OS Dokumente kategorisiert (format- und inhaltsbasiert), wie du mit dem Read File Agent und Generative AI Agent strukturierte Daten aus PDFs extrahierst, wie du die Ergebnisse im Internal Storage sicherst und wie du mit dem JSON Split Agent mehrere Dokumente auf einmal verarbeitest.
Übungen — fünf praktische Aufgaben, in denen du das Gelernte direkt umsetzt. Du arbeitest dabei immer mit dem Web Form Agent — du lädst Dokumente über ein Formular hoch und verarbeitest sie im Workflow.
- Dokumente manuell über ein Web-Formular hochladen
- Dokumente anhand von Dateiname und Dateityp kategorisieren
- Dokumente anhand des Dateiinhalts kategorisieren
- Daten aus Dokumenten extrahieren und strukturieren
- Bestelldaten in die Datenbank schreiben und abrufen
Theorie-Einheiten
- Dokumente kategorisieren
- Daten aus Dokumenten extrahieren und strukturieren
- Extrahierte Daten speichern
- Dokumente vereinzeln
Übungen
- Übung: Dokumente manuell hochladen
- Übung: Kategorisierung nach Dateiname und Dateityp
- Übung: Kategorisierung nach Dateiinhalt
- Übung: Daten extrahieren und strukturieren
- Übung: Bestelldaten speichern und abrufen
Die Übungen bauen aufeinander auf. Beginne mit der ersten und arbeite sie der Reihe nach durch.